#modelos de lenguaje grande

El Impuesto del Ajuste por Instrucciones en LLMs para Código

El ajuste por instrucciones mejora la comprensión de comandos pero perjudica la finalización de código en flujo. Conoce el 'impuesto' oculto.

2026-06-09 · 3 min

Evaluación del control de activación y desalineación emergente

¿Sabías que el control de activación en modelos de lenguaje puede generar desalineación emergente? Este estudio revela riesgos de seguridad inesperados.

2026-06-09 · 2 min

MetaEvo: Metaoptimización para la evolución de agentes con experiencia

MetaEvo permite a los agentes de IA mejorar su razonamiento aprendiendo de la experiencia mediante metaoptimización. Dos fases para una evolución continua.

2026-06-09 · 1 min

Generación de casos de prueba con IA desde lenguaje natural: técnicas y brechas

Explora cómo la IA genera casos de prueba desde requisitos en lenguaje natural. Analizamos técnicas, herramientas y brechas de investigación.

2026-06-08 · 3 min

Geografía del juicio algorítmico: identidad de lugar y sesgo racial con LLM

Descubre cómo los LLMs generan sesgo racial en la búsqueda de vivienda según identidad del usuario y ciudad. Estudio revela riesgos para vivienda justa.

2026-06-08 · 2 min

Razonamiento estable, respuestas inestables: clave contra el engaño en LLM

Descubre cómo la asimetría de estabilidad entre el razonamiento interno y las respuestas externas revela el engaño en LLMs, y cómo una nueva regularización lo mitiga sin perder capacidad.

2026-06-08 · 2 min

No pauses: Sincronía de video-lenguaje en streaming para comprensión de video

LyraV logra sincronía del 98.29% entre video y lenguaje sin pausas. Procesamiento incremental y control jerárquico para comprensión de video en tiempo real.

2026-06-08 · 2 min

Demostraciones vs supervisión: clasificación de expresiones idiomáticas turcas

Descubre cómo los modelos supervisados y los LLMs con demostraciones compiten para clasificar locuciones turcas. ¿Cuál gana?

2026-06-08 · 2 min

Subespacios dispersos de expertos para aprendizaje continuo sin tareas

SETA evita el olvido catastrófico en LLMs mediante subespacios dispersos de expertos. Mejora retención de conocimiento temprano.

2026-06-08 · 2 min

Agentes de modelos de lenguaje pequeños para minería de conocimiento eficiente

Falconer: LLMs planificadores + modelos proxy ligeros para extraer conocimiento, reduciendo costos un 90% y acelerando 20x la minería de conocimiento.

2026-06-08 · 1 min

¿Deberías usar tu modelo de lenguaje grande para explorar o explotar?

¿LLM para explorar o explotar? Este estudio muestra que los LLM razonan bien en explotación, pero son caros. Herramientas y resúmenes mejoran rendimiento.

2026-06-08 · 3 min

Normalización de bases de datos con autorrefinamiento dual LLM

Descubre cómo Miffie automatiza la normalización de bases de datos con un novedoso sistema de doble LLM que genera y verifica esquemas, garantizando alta precisión sin esfuerzo manual.

2026-06-08 · 1 min

¿Qué deben decir los agentes? Comunicación acción-estado eficiente

Descubre cómo PACT optimiza la comunicación acción-estado en MAS, reduciendo tokens y mejorando rendimiento. ¡Ahorra costos!

2026-06-06 · 2 min

¿Qué deberían decir los agentes? PACT para sistemas multiagente

Descubre cómo PACT revoluciona la comunicación en sistemas multiagente, reduciendo tokens sin perder rendimiento. Optimiza tus agentes de IA con acción-estado.

2026-06-06 · 2 min

Prioridades estadísticas para preferencias implícitas en agentes personales

Un arnés local de prioridades estadísticas permite a agentes personales aprender preferencias implícitas, superando a la memoria tradicional.

2026-06-06 · 1 min

ReTreVal: Razonamiento en Árbol con Validación y Memoria entre Problemas

ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.

2026-06-06 · 2 min

ReasoningFlow: Estructuras discursivas en trazas de LLM

ReasoningFlow revela patrones discursivos en trazas de LLM, mejorando la transparencia y el análisis del razonamiento automático.

2026-06-06 · 2 min

Alpha-RTL: Entrenamiento en tiempo de prueba para optimización de hardware RTL

Descubre cómo Alpha-RTL reduce el producto PPA en un 65% mediante entrenamiento en tiempo de prueba con retroalimentación EDA, superando métodos tradicionales.

2026-06-05 · 3 min

Razonamiento latente con flujos normalizadores

NF-CoT: razonamiento latente con flujos normalizadores para código eficiente y preciso. Supera a la cadena de pensamiento tradicional.

2026-06-05 · 3 min

Ranking consciente de jueces para evaluar LLMs sin verdad de campo

Descubre cómo este marco de ranking consciente de jueces mejora evaluaciones de LLMs sin etiquetas de referencia, optimizando fiabilidad y eficiencia.

2026-06-05 · 2 min